变异自动编码器(VAE)容易受到对抗攻击的影响。对手可以在输入样本中找到一个小的扰动,以更改其潜在编码,从而损害重建。这种脆弱性的一个已知原因是由近似潜在后部和先前分布之间的不匹配引起的潜在空间扭曲。因此,输入的略有变化会导致潜在空间编码发生重大变化。本文表明,数据点的灵敏度是由于编码器网络引起的随机回调度量张量的定向偏置。回调度量张量从输入到潜在空间的无限体积变化。因此,可以将其视为镜头,以分析输入的小变化的影响,从而导致潜在空间中的扭曲。我们建议使用回调度量的特征性评估得分。此外,我们从经验上表明,分数与$ \ beta- $ vae的稳健性参数$ \ beta $相关。
translated by 谷歌翻译
视网膜性状或表型,总结了单个数字的视网膜图像的特定方面。然后可以将其用于进一步的分析,例如使用统计方法。但是,将复杂图像的一个方面减少到一个有意义的数字是具有挑战性的。因此,计算视网膜性状的方法往往是复杂的多步管道,只能应用于高质量的图像。这意味着研究人员通常必须丢弃大量可用数据。我们假设可以通过一个更简单的步骤来近似此类管道,这可以使常见的质量问题变得强大。我们提出了视网膜特征(DART)的深近似,其中使用深神经网络预测了这些图像的合成降解版本的高质量图像的现有管道的输出。我们使用来自英国生物库的视网膜图像计算出的视网膜分形尺寸(FD)的飞镖,这些图像先前的工作被确定为高质量。我们的方法在看不见的测试图像上显示与FD吸血鬼非常一致(Pearson r = 0.9572)。即使这些图像严重退化,DART仍然可以恢复FD估计值,该估计值与从原始图像获得的FD吸血鬼表示良好(Pearson r = 0.8817)。这表明我们的方法可以使研究人员将来丢弃更少的图像。我们的方法可以使用单个GPU计算超过1,000IMG/s的FD。我们认为这些是非常令人鼓舞的初步结果,并希望将这种方法发展为视网膜分析的有用工具。
translated by 谷歌翻译
成功部署多机构强化学习通常需要代理来适应其行为。在这项工作中,我们讨论了团队合作适应的问题,其中一组代理团队需要调整其政策以通过有限的微调解决新的任务。由代理人需要能够识别和区分任务以使其行为适应当前任务的直觉的动机,我们建议学习多代理任务嵌入(MATE)。这些任务嵌入方式是使用针对重建过渡和奖励功能进行优化的编码器架构训练的,这些功能唯一地识别任务。我们表明,在提供任务嵌入时,一组代理商可以适应新颖的任务。我们提出了三个伴侣训练范例:独立伴侣,集中式伴侣和混合伴侣,这些伴侣在任务编码的信息中有所不同。我们表明,伴侣学到的嵌入识别任务,并提供有用的信息,哪些代理在适应新任务期间利用了哪些代理。
translated by 谷歌翻译
现实世界中的对象检测模型应便宜且准确。知识蒸馏(KD)可以通过利用大型教师模型的有用信息来提高小型,廉价检测模型的准确性。但是,一个关键的挑战是确定老师进行蒸馏产生的最有用的功能。在这项工作中,我们表明,在地面边界框中只有一小部分功能才是老师的高检测性能。基于此,我们提出了预测引导的蒸馏(PGD),该蒸馏将蒸馏放在教师的这些关键预测区域上,并在许多现有的KD基准方面的性能取得了可观的增长。此外,我们建议对关键区域进行自适应加权方案,以平滑其影响力并取得更好的性能。我们提出的方法在各种高级一阶段检测体系中的当前最新KD基准都优于当前的最新KD基线。具体而言,在可可数据集上,我们的方法分别使用RESNET-101和RESNET-50作为教师和学生骨架,在 +3.1%和 +4.6%的AP改进之间达到了AP的改善。在CrowdHuman数据集上,我们还使用这些骨架,在MR和AP上取得了 +3.2%和 +2.0%的提高。我们的代码可在https://github.com/chenhongyiyang/pgd上找到。
translated by 谷歌翻译
深度学习(DL)模型在许多计算机视觉问题上非常有效,并且越来越多地用于关键应用。他们也是黑人盒子。存在许多方法以生成图像明智的解释,其允许从业者理解和验证给定图像的模型预测。除此之外,希望验证DL Model \ Textit {一般}以明智的方式工作,即与域知识一致,而不是依赖于不期望的数据伪影。为此目的,需要在全球范围内解释模型。在这项工作中,我们专注于自然对齐的图像模态,使得每个像素位置表示成像对象上的相似位置,如在医学成像中常见。我们提出了图像明智的解释的像素明智的聚合作为获得标签和整体全局解释的简单方法。然后,这些可以用于模型验证,知识发现,以及传达从检查图像明智的解释的定性结论的有效方法。我们进一步提出了进步擦除加上渐进式恢复(PEPPR)作为定量验证这些全球解释忠于模型如何使其预测的方法。然后,我们将这些方法应用于超广域视网膜图像,是一种自然对齐的模态。我们发现全球解释与域知识一致,忠实地反映了模型的工作。
translated by 谷歌翻译
我们为高维顺序数据提出了深度潜在的变量模型。我们的模型将潜在空间分解为内容和运动变量。为了模拟多样化的动态,我们将运动空间分成子空间,并为每个子空间引入一个独特的哈密顿运算符。Hamiltonian配方提供可逆动态,学习限制运动路径以保护不变性属性。运动空间的显式分裂将哈密顿人分解成对称组,并提供动态的长期可分离性。这种拆分也意味着可以学习的表示,这很容易解释和控制。我们展示了我们模型来交换两个视频的运动,从给定的图像和无条件序列生成产生各种动作的序列。
translated by 谷歌翻译
In today's uncertain and competitive market, where enterprises are subjected to increasingly shortened product life-cycles and frequent volume changes, reconfigurable manufacturing systems (RMS) applications play a significant role in the manufacturing industry's success. Despite the advantages offered by RMS, achieving a high-efficiency degree constitutes a challenging task for stakeholders and decision-makers when they face the trade-off decisions inherent in these complex systems. This study addresses work tasks and resource allocations to workstations together with buffer capacity allocation in RMS. The aim is to simultaneously maximize throughput and minimize total buffer capacity under fluctuating production volumes and capacity changes while considering the stochastic behavior of the system. An enhanced simulation-based multi-objective optimization (SMO) approach with customized simulation and optimization components is proposed to address the abovementioned challenges. Apart from presenting the optimal solutions subject to volume and capacity changes, the proposed approach support decision-makers with discovered knowledge to further understand the RMS design. In particular, this study presents a problem-specific customized SMO combined with a novel flexible pattern mining method for optimizing RMS and conducting post-optimal analyzes. To this extent, this study demonstrates the benefits of applying SMO and knowledge discovery methods for fast decision-support and production planning of RMS.
translated by 谷歌翻译
我们提出了一种新颖的端到端方法,用于在事件流中进行关键点检测和跟踪,该方法比以前的方法提供了更好的精度和更长的关键点轨道。两项贡献共同努力使这成为可能。首先,我们提出了一个简单的过程来生成稳定的关键点标签,我们用来训练复发架构。该培训数据导致检测随着时间的推移非常一致。此外,我们观察到以前的按键检测方法在一段时间内集成事件的表示形式(例如时间表面)。由于需要这种集成,因此我们声称最好预测时间段的关键点的轨迹,而不是单个位置,如先前的方法中所做的那样。我们以一系列热图的形式预测这些轨迹在整合时间段。这可以改善关键点本地化。我们的体系结构也可以保持非常简单,从而导致非常快的推理时间。我们在HVGA ATIS角数据集以及“事件相机数据集和模拟器”数据集上演示了我们的方法,并将其显示为“关键点”轨道的三倍,几乎是最好的先前最佳先前最佳先前的轨道轨迹。 - 艺术方法。我们认为我们的方法可以推广到其他基于事件的相机问题,并发布我们的源代码以鼓励其他作者探索它。
translated by 谷歌翻译
我们提出了Theseus,这是一个有效的应用程序不合时宜的开源库,用于在Pytorch上构建的可区分非线性最小二乘(DNL)优化,为机器人技术和视觉中的端到端结构化学习提供了一个共同的框架。现有的DNLS实施是特定应用程序的,并且并不总是纳入许多对效率重要的成分。 Theseus是应用程序不可静止的,正如我们使用的几个示例应用程序所用的,这些应用程序是使用相同的基础可区分组件构建的,例如二阶优化器,标准成本功能和Lie组。为了提高效率,TheseUS纳入了对稀疏求解器,自动矢量化,批处理,GPU加速度和梯度计算的支持,并具有隐式分化和直接损耗最小化。我们在一组应用程序中进行了广泛的性能评估,显示出这些功能时显示出明显的效率提高和更好的可扩展性。项目页面:https://sites.google.com/view/theseus-ai
translated by 谷歌翻译
连续归一化流(CNF)是一类生成模型,可以通过求解普通的微分方程(ODE)将先验分布转换为模型分布。我们建议通过最大程度地减少概率路径差异(PPD)来训练CNF,这是CNF产生的概率密度路径与目标概率密度路径之间的新型差异家族。 PPD是使用对数质量保护公式制定的,该公式是线性的一阶部分微分方程,将对数目标概率和CNF的定义向量场进行配方。 PPD比现有方法具有多个关键好处:它避免了在迭代中解决颂歌的需求,很容易应用于歧管数据,比例到高维度,并与大型目标路径兼容,该目标路径在有限的时间内插值纯噪声和数据。从理论上讲,PPD显示为结合经典概率差异。从经验上讲,我们表明,通过最小化PPD实现最新的CNF在现有的低维歧管基准上获得了最新的可能性和样品质量,并且是生成模型以扩展到中度高维歧管的第一个示例。
translated by 谷歌翻译